¿Qué es R?
- R es un lenguaje de programación orientado a la realización de procesos estadísticos y gráficos.
- Arrancó en los años 1993/96 y fue creado por Ross Ihaka and Robert Gentleman (Auckland University, Nueva Zelanda), basándose en el lenguaje S (1976).
- A diferencia de S, R es un software de código abierto ("open source"). Es gratuito!
Filosofía de R: "hibridez"
R propone satisfacer dos modalidades de trabajo muy frecuentes para los analistas de datos:
Con una interfaz interactiva, con línea de comandos: se dispone de una consola, donde se tipea un comando, se da enter y algo sucede. Voy viendo y haciendo.
Como lenguaje de programación: para tareas más complejas, escribimos un programa (o "script") y lo ejecutamos en un servidor o desde la terminal de la compu. No se trabaja comando por comando.
R es un híbrido entre estas dos modalidades.
Filosofía de R: "Software Libre"
R se distribuye bajo la licencia para software GNU GPLv2 que establece las siguientes libertades:
- Libertad de usar el programa con cualquier propósito.
- Libertad de ver cómo fue hecho, cómo funciona y modificarlo.
- Libertad de distribuir copias.
- Libertad de publicar modificaciones y agregados para que estén disponibles para la comunidad.
Filosofía de R: "Comunidad"
- R tiene una comunidad de usuarios muy activa, de las más diversas áreas (es interdisciplinario).
- Probablemente, casi todo lo que quieras hacer, alguien más ya lo pensó, lo hizo y dejó un hermoso tutorial por ahí para que vos también lo puedas hacer (es extensible).
- Cualquier mensaje de error que te aparezca, lo googleas y seguro hay muchas páginas con gente debatiendo cómo solucionarlo (es comunitario).
- Existen miles de páginas, blogs y foros de ayuda en internet (por ejemplo, StackOverflow).
Otras características de R
- Se integra con otras herramientas (como Latex) para generar manuscritos y presentaciones que pueden actualizarse automáticamente.
- Disponible en cualquier plataforma de sistema (Windows, OS X, Linux).
- Provee herramientas gráficas para generar figuras de excelente calidad listas para publicación.
- Podemos trabajar con múltiples fuentes de datos: Excel, CSV, texto plano, bases de datos, y mucho mas …
Diseño del sistema R
Se divide en dos partes:
- La base ("base R System"): se descarga desde CRAN ("Comprehensive R Archive Network"). Funciones básicas y fundamentales de R.
Diseño del sistema R
- El resto: incluye miles de paquetes con funcionalidad específica que el usuario puede elegir descargar también desde CRAN u otros lugares.
Hay más de 12500 paquetes regristrados y aprobados en CRAN
Ok!… ¿Pero qué cosas puedo hacer en R?
Análisis estadísticos
Hermosos gráficos!!
Documentos para presentaciones e informes
Hay mas!!
- Gráficos interactivos
- Libros y publicaciones online
- Aplicaciones para páginas web
- Material para dar clases
- Etc., etc., etc., …
¿Qué es Rstudio?
- RStudio es un entorno de desarrollo integrado (IDE) para R.
- Un entorno de desarrollo integrado es una aplicación informática que proporciona servicios integrales para facilitarle al programador el desarrollo de software.
¿Por qué usar RStudio?
- permite abrir y editar varios archivos a la vez
- incluye autocompletado y resaltador de código
- permite ejecutar porciones de código con sólo seleccionarlos en el programa
- muestra el workspace (todos los elementos que hemos creado con nuestro programa)
- muestra el historial de sentencias ejecutadas
- integra ayuda y documentación
- integra la gestión de paquetes adicionales
- gestiona proyectos de trabajo
- gestiona gráficos
y mucho más!
Conociendo a RStudio
- Cuando se abre RStudio por primera vez se pueden visualizar tres paneles:
Captura de pantalla de RStudio
Conociendo a RStudio
- La consola. Es la ventana que se comunica con el motor de R.
Arriba a la derecha, el panel con las pestañas:
- Environment (ambiente): muestra todas las cosas (objetos) que R tiene en la cabeza (memoria), como conjuntos de datos, modelos, resultados, etc.
- History (historial): lista todas las instrucciones que R ha corrido.
Abajo a la derecha: panel con las pestañas Files, Plots, Packages, Help y Viewer. Tienen lo que sus nombres indican!
Cosas que yo también hubiese querido saber cuando empecé a usar R
- Usar RStudio
- Usar Knitr
- Organizar mi análisis (limpieza de datos, visualización, análisis)
- Usar control de versiones
- Preguntar dando un ejemplo reproducible
- Usar tidyverse
S.O.S. en R
Blogs y portales de ayuda:
- Stack Overflow
- R Bloggers
- Quick R
- R Bloggers
- Cookbook for R
- STHDA
- Muchos más…
S.O.S. en R
Libros:
- R for Data Science
- R programmig for data science
- An Introduction to Statistical and Data Sciences via R
Cheatsheets (machetes), por ejemplo, los de RStudio
Material de clases que están online, por ejemplo, STATS545
Twitter #rstats
¡Muchas gracias!
Agradecemos a los chicos de R en Rosario por pasarnos el material para esta presentación